在這篇22頁的論文裡,我想做令人興奮的地方應該就是,不用透過太繁雜設定,只要賦予人格與足夠的資訊,可以讓agents們自己產生傳播訊息、產生社會行為,單純只透過GhatGPT這模型,可以作到這種程度蠻令人驚羨的。這對於社會學的研究來講應該是一個很棒的研究沙盒,還有很多大型開方性世界遊戲,我想就不用一直去設定NPC的腳本,可能讓語言模型自己處理這一塊,或創造些偶放性事件。
Emergent Social Behaviors
論文提到,我們單純只靠著一些簡單的暗示或假agent互動,則可以構成訊息傳播與行為的建構,在論文裡面兩件被觀察的事件。以下兩個事件時間的區段為兩天,總共有25個agents在該社區。
- 山姆參選市長競賽
山姆想選市長,並把這個消息跟其他agent講這件事情,接著口耳相傳,慢慢得很其他人也知道了這件事情,過程中也會發表意見與討論,產生支持與觀望的應對。在該實驗最後,從只有一個人(山姆本身)知道,最終有8個人知道山姆要選舉了。
- 伊莉莎白的情人節派對
跟上述一樣,不過該事件除了訊息傳播,還要agents產生特定行為,分別是讓派對的前置作業與派對參與。伊莉莎白跟她的好朋友提到這件事情後,他們在某個時間點到了店裡在做裝飾(細節我有點不太清楚,應該不會到買材料到店裡做佈置吧…) 以及,當天是否真的有參與派對。
事件的最後,實驗者做了測試,從只有1個人(伊莉莎白本身)到最終有13個人知道 (看來辦趴比選舉還重要阿XD),活動當天,邀請的12個人有5個人到,沒到的7個人有3個人說有很重要事情無法參與(該死的放鴿子),4個人說有興趣但卻爽約(不知道在衝三小)。
我猜語言的傳遞比較容易,但行為建構,可能本身有點複雜,需要足夠的記憶以及動機,所以參與度才導致這麼低,不過論文這一塊沒詳述,單純個人猜測。
另外對於驗證訊息傳遞上,作者使用蠻嚴謹的方式確認,首先詢問agents相關訊息,然後在透過記憶流檢索,確認你是否在瞎掰,就像是在警察局詢問完你後,派克諾妲突然從後面小門說:ㄏㄏ瞎掰什麼都是沒用的
User Controls
要怎麼控制或是操作整個選擇(?) 實驗提到兩種方式
- 假扮agent
例如該實驗就假扮成為記者的agents,對選舉做採訪,就像是我們生活在地球,可能周遭的親友就是外星人(?)
- inner voice (內心的呼喚)
就像你經過小木屋鬆餅一樣,內場的巧克力鬆餅香氣撲鼻而來,你內心的小惡魔在呢喃:昨天考試好辛苦哦… 該來買一塊鬆餅犒賞自己…
文中就是用到第二者方式,去作到剛上述兩個,事件的初始化。
第一種方式就是偏調查,看你是否有這個記憶,以及與這個人的關係
結語
覺得蠻好玩的,想法也沒太困難,剛剛提到假扮agent跟內心的呼喚,都是現實中會發生的事情。朋友慫恿你在喝一杯呀之類… 不過實做工程就有很多細節,但我們這種論文讀者,還是可以看看概念,獲得一些啟發或靈感的來源
參考
Generative Agents: Interactive Simulacra of Human Behavior